Entwicklung algorithmischer Skelette für CUDA am Beispiel von Affintiy Propagation
نویسنده
چکیده
In diesem Artikel wird anhand des Clusteralgorithmus Affinity Propagation (AP) eine Bibliothek bestehend aus algorithmischen Skeletten vorgestellt, mit deren Hilfe Berechnungen auf die GPU verlagert werden können. Nach einer kurzen Beschreibung von AP wird eingehend auf die Implementierung der Bibliothek und deren Skelette eingegangen: Sowohl die abstrakten Bausteine als auch die konkrete Umsetzung und Verwendung für AP werden dargestellt. Durch das hohe Abstraktionsniveau der Bibliothek und durch Nutzung etablierter CUDA/C++ Konzepte wie Iteratoren und Funktionsobjekte entsteht eine Sammlung nützlicher Funktionen, die einerseits als Ergänzung zu bestehenden Bibliotheken, andererseits als Basis für weitere Entwicklungen dient. Die Wiederverwendbarkeit, Wartbarkeit und Übersichtlichkeit der Anwendungen werden durch deren Verwendung gesteigert. Eine kurze Analyse über das Laufzeitverhalten im Vergleich zu anderen Funktionssammlungen zeigt, dass die entwickelten Funktionen bessere Laufzeiten erzielen. Dadurch lässt sich AP unter Nutzung der Skelette im Vergleich zu einer sequenziellen Version um Faktor 40 50 beschleunigen.
منابع مشابه
Modularität als kritischer Erfolgsfaktor von Open Source Projekten am Beispiel von osCommerce
Die Modularität einer Softwarearchitektur stellt einen Erfolgsfaktor für den Entwicklungsprozess dar. Dieser Faktor entfaltet insbesondere bei der verteilten und dezentralen Entwicklung von Open-Source-Software Wirksamkeit. Am Beispiel der E-Commerce-Lösung osCommerce wird der Einfluss fehlender Modularität geprüft und veranschaulicht. osCommerce leidet seit der Projektinitiierung unter einem s...
متن کاملMehrstufige zeit- und bewegungsabhängige Rauschreduktion in Echtzeit mittels CUDA
Die Bildgebung interventionell genutzter Angiographieanlagen mittels Röntgentechnologie stellt heute sehr hohe Anforderungen an die Bildqualität. Diese wird durch verschiedenste Faktoren beeinflusst und ist für den Echtzeitbetrieb sicherzustellen, d.h. typischerweise sind die Algorithmen zur Bildverbesserung für einen maximalen Datenstrom von 480-600MBits/s (monoplan-System) bei einer maximalen...
متن کاملBeschreibung von Unternehmensarchitekturen: Sichten und Abhängigkeiten am Beispiel der IT-Infrastrukturarchitektur
Der Aufsatz stellt einen Ordnungsrahmen für Unternehmensarchitekturen in der Übersicht vor. Dieser setzt sich aus den Teilarchitekturen: Geschäfts(prozess)architektur, Applikationsarchitektur, Informationsarchitektur und Infrastruktur/Technologiearchitektur zusammen. Für die Beschreibung von Unternehmensarchitekturen können unterschiedliche Schwerpunkte gebildet werden, die jeweils einen spezif...
متن کاملDurchgängige Modularität in der modellgetriebenen Entwicklung domänenspezifischer Modellierungssprachen mit Hilfe aspektorientierter Programmierung
Das hier vorgestellte Promotionsvorhaben hat zum Ziel, eine durchgehend modulare Entwicklung von domänenspezifischen Modellierungssprachen und deren Implementierung in Werkzeugen zu ermöglichen. Dazu werden Modularisierungskonzepte auf Metamodell-Ebene analysiert, erweitert und mit Hilfe aspektorientierter Mechanismen in die Implementierung übertragen. Das Ergebnis soll ein Framework für die En...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2014